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SIAD - Laborator nr. 5 


Multidimensional Extensions (MDX) — Extensii multidimensionale 


MDX oferă posibilitatea interogării depozitului de date pentru a obține informaţiile de 
care un utilizator are nevoie. Avand in vedere ca depozitul de date este structurat in forma 
multidimensională (cuburi de date, dimensiuni, măsuri, etc.), interogările vor diferi de cele tip 
SQL adaptate pentru modelul relational. 

Elementele de de bază în MDX sunt numere (numbers), şiruri (strings), membri 
(members), tupluri (tuples) şi seturi(sets). 

Numere — integer, decimal, float, double 

Şiruri — secvenţe de caractere 

Membri — un membru MDX este valoarea unui atribut aparținând unei dimensiuni. De 
exemplu, pentru o dimensiune Timp care are An şi Trimestru ca niveluri, atunci 1998 şi T1 sunt 
membri valizi. MDX are un set de expresii numite expresii membru care pot fi folosite pentru a 
opera asupra oricărui membru care aparține unei dimensiuni. Expresiile membru returnează 
întotdeauna alt membru al dimensiunii sau valoarea zero. De exemplu, una dintre aceste expresii 
este parent. Dacă avem o dimensiune care include Country, State şi City şi avem membrul NY, 
atunci Parent(NY) va fi US. Parent(US) va returna 0, deoarece s-a ajuns la limita superioară a 
ierarhiei. Expresiile membru permit navigarea în ierahia unei dimensiuni. 

Tupluri — un tuplu MDX este o colecţie de membri din dimensiuni diferite. De exemplu, 
([Manhattan], [1997]) este un tuplu format din membrii a două dimensiuni: Geography şi Time. 
Tuplurile reprezintă o poziţie unică în cadrul axelor cubului. O dimensiune nu poate fi 
reprezentată de două ori într-un tuplu; de exemplu, (Manhattan, Chicago) nu este un tuplu. 

Seturi — un set MDX este o colecţie de elemente set tupluri; tuplurile set sunt ca tuplurile 
obişnuite, exceptând faptul că un tuplu set este o colecție de membri din aceeaşi dimensiune sau o 
colecție de membri din dimensiuni diferite. Un set este format din conţinutul unei axe a cubului. 

O interogare MDX poate conţine expresii set, expresii membru şi funcții numerice. Toate 
acestea sunt denumite generic expresii MDX. O expresie foarte importantă este MEMBERS. 
Folosind MEMBERS cu un nivel al unei dimensiuni este echivalent cu crearea unui set cu toţi 
membrii acelui nivel al dimensiunii. Astfel, în depozitul de date FoodMart, 
| Customer].| Country ]. MEMBERS este echivalent cu ({Customer].[USA]), 
({Customer].[Canada]), ([Customer].[Mexico]). 


Structura de baza a interogarilor MDX 
Pentru ca o interogare MDX să returneze un set de date, trebuie incluse următoarele 
elemente în interogare: 

e Numele cubului sau cuburilor care vor fi folosite pentru a obţine datele necesare. 

e Axele MDX. O axă conţine membri din unul sau mai multe tupluri. Axele MDX sunt 
diferite de axele cubului: axele cubului sunt un set de coordonate în care fiecare axă 
reprezintă o singură dimensiune; acestea sunt diferite de axele în sens MDX, care 
reprezintă un set. 

În mod uzual, se lucrează cu două axe deoarece majoritatea instrumentelor folosite pentru 
a afişa datele pot folosi doar două axe (Excel). Fiecare tuplu conţine membri din dimensiuni 
diferite. Astfel, dacă avem un tuplu format din [Product].[Product family] MEMBERS si 
[Customer].[Country]. MEMBERS, valorile care vor fi localizate vor fi (Drink, Canada), (Drink, 
Mexico), (Drink, USA), (Food, Canada), (Food, Mexico), etc. Tuplurile se folosesc pentru a 
defini puncte in cub; aceste puncte reprezinta locurile unde se afla valorile numerice care ne 
interesează. 
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Sintaxa generală a unei interogari MDX este următoarea: 
SELECT <axis_specification> [,<axis_specification>, ...] 
FROM <cube_specification> 
WHERE <slicer_specification> 


Specificarea axelor si a cubului 
Specificatiile MDX nu limitează numărul de axe pe care le putem folosi într-o interogare 
MDX. În cazul în care se optează pentru doar două axe, atunci axa X va reprezenta coloanele, iar 
axa Y liniile. Într-o interogare MDX trebuie specificată cel putin o axă. 
Exemplu: 
SELECT 
{ ([MEASURES].[Unit Sales]) } ON COLUMNS, 
{ ([Time].[ Year]. MEMBERS) } ON ROWS 
FROM Sales 


266,773.00 


(nota: pentru anul 1998 nu sunt inregistrate vanzari in depozitul de date) 


În exemplul anterior, expresia MEMBERS returnează toate valorile de la nivelul 
respectiv. În cazul nostru, [Time].[Year] are doi membri, 1997 şi 1998. Astfel, această interogare 
mai putea fi scrisă şi în felul următor: 

SELECT 

{ ([MEASURES].[Unit Sales]) } ON COLUMNS, 
{ ([Time].[1997]), ([Time].[1998]) } ON ROWS 
FROM Sales 


Ambele interogări furnizează in final acelaşi rezultat, însă este mult mai comodă varianta 
cu expresia MEMBERS. 

Acoladele, {}, sunt folosite pentru a marca seturile, care în acest caz reprezintă definițiile 
axelor. Parantezele rotunde, (), sunt folosite pentru a marca fiecare tuplu. Parantezele pătrate, |], 
sunt folosite pentru a marca nivelul fiecărui membru. 

Clauza FROM este folosită pentru a specifica numele cubului din care sunt extrase datele. 

Datorită faptului că cele mai multe interogări au două axe, MDX defineşte COLUMNS şi 
ROWS ca fiind primele două axe. De remarcat că axele care urmează după primele două au şi ele 
nume implicite. Acestea sunt PAGES pentru a treia axă, SECTIONS pentru a patra şi 
CHAPTERS pentru a cincea. Fiecare axă poate fi de asemenea referită cu AXIS(i), unde i este 
numărul axei (COLUMNS are numărul 0, ROWS 1, şi aşa mai departe). 

Este important de ştiut faptul că măsurile (valorile numerice, faptele) sunt plasate în 
propria lor dimensiune numită MEASURES. Folosind această dimensiune, pot fi accesate oricare 
dintre faptele asociate cubului. 

Pentru a „simula” drill-down cu interogárile MDX, tot ce avem de făcut este sá 
creştem gradul de detaliere pentru una dintre axe. De exemplu, interogarea următoare 

SELECT 

{ ([MEASURES].[Unit Sales] ) } on COLUMNS, 
{ ( [Time].[1997].[Q1] ) } on ROWS 
FROM Sales 
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Unit Sales 
66,291.00 


oferá informatii despre vánzárile pentru trimestrul 1. Dacá dorim sá vedem vázárile mai analitic 
(pentru prima luná de exemplu), vom creste gradul de detaliere astfel: 
SELECT 
{ ([MEASURES].[Unit Sales] ) } on COLUMNS, 
{ ([Time].[1997].[Q1].[1] ) } on ROWS 
FROM Sales 


Erori ín cadrul interogárilor: 
Pare a fi posibilá o interogare de felul urmátor pentru a obtine vánzárile pe trimestre in 
anul 1998: 
SELECT 
{ ([Measures].[Unit Sales])} ON COLUMNS, 
{ ([Time].[1998].[Quarter]. MEMBERS )} ON ROWS 
FROM Sales 
De fapt, o astfel de interogare va genera o eroare MDX. Pentru a obţine vanzarile pentru 
toate trimestrele din 1998, se poate folosi expresia Descendants. Interogarea corectă în acest caz 
este următoarea: 
SELECT 
{({Unit Sales])} ON COLUMNS, 
{Descendants( [Time].[1998], [Time].[Quarter] )} ON ROWS 
FROM Sales 


Descendants este o expresie pentru seturi şi va fi discutată detaliat într-un paragraf viitor. 

Dacă identificám o valoare specifică, precum 1998, atunci când creştem gradul de 
detaliere (drill-down) într-o ierarhie a dimensiunii folosind operatorul punct (.), toate intrările 
pentru toate nivelurile trebuie să fie valori specifice. Astfel, 1997.Q1 şi 1997.Q1.1 vor funcţiona, 
în timp ce 1997.Quarter sau 1997.Quarter. MEMBERS vor genera o eroare MDX. 


Prin folosirea elementelor de bază ale unei interogări MDX, putem obţine valori specifice 
pentru o măsură (variabilă, faptă) sau pentru toate măsurile. De exemplu, pentru a obţine 
vânzările pentru toţi clienţii din Statele Unite folosim următoarea interogare MDX: 

SELECT 

1 ([Measures].[Unit Sales] ) ! ON COLUMNS, 
1 ([Customers].[ All Customers].[USA] ) } ON ROWS 


FROM Sales 
Lena 
266,773.00 
Nota: Se poate lansa interogarea precedenta si fara a specifica [All Customers]. Serverul 
OLAP va scana dimensiunea Customers şi va identifica nivelul corect, însă este recomandabil sa 
se specifice nivelul cât mai explicit. Astfel, interogările vor fi mai uşor de înțeles de câtre 
utilizator şi garantează faptul că returnează valorile dorite. 
Următoarea interogare va funcţiona de asemenea: 
SELECT 
1 ([Measures].[Unit Sales] ) ! ON COLUMNS, 
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{ ( [Time].[1997].[Q1].[1]) , ((Time].[1998].[Q1].[1] ) } ON ROWS 
FROM Sales 
În acest caz avem un set format din două tupluri care contin un membru al dimensiunii 
Time. Ştim că sunt două tupluri datorită faptului că sunt incluse între paranteze rotunde. În cazul 
schimbării interogării după modelul de mai jos, va apare o eroare datorită faptului că în ierarhie s- 
a “sărit” peste nivelul trimestru (Q1). 
SELECT 
1 ([Measures].[Unit Sales] ) + ON COLUMNS, 
{ ([Time].[1997].[1] ), ( [Time].[1998].[1] ) } ON ROWS 
FROM Sales 


Este foarte important de reținut că atunci când se operează cu valori specifice, “calea” 
până la valoarea respectivă trebuie precizată complet (vezi exemplul anterior). Pe de altă parte, 
dacă folosim nume de niveluri, precum Country sau State Province şi cuvântul cheie MEMBERS, 
este necesar sá specificăm doar numele dimensiunii şi numele nivelului pe care dorim să-l 
folosim. 

Când folosim un nume pentru a desemna un membru, serverul OLAP va căuta un 
domeniu pentru numele respectiv; în mod obişnuit, domeniul este un singur cub de date. Atâta 
timp cât numele este unic, nu apare nici o problemă; dacă numele nu este unic, serverul OLAP nu 
poate rezolva problema şi va genera o eroare. Este foarte important deci să ne asigurăm că 
numele membrului este specificat cât mai exact cu putință. 


Dimensiuni imbricate 
Aşa cum este de aşteptat, avem posibilitatea de a folosi dimensiuni imbricate; pentru a 
reuşi acest lucru, trebuie să se folosească un tuplu cu mai mult de un membru în clauza SELECT 
(vezi exemplul următor). 
SELECT 
1 ([Measures].[ Unit Sales] ) + ON COLUMNS, 
1 ([Customers].[ All customers].| USA] , [Product].[ All Products].[ Food] )} 
ON ROWS 


FROM Sales 
Unit Sales 
USA 191,940.00 
În acest caz, 


{( [Customers].[AllCustomers].[USA] , [Product].[AllProducts].[Food])} 
este folosit ca un tuplu pentru a returna vânzările pentru toți clienţii din USA care au 
cumpărat produse din categoria Food. Dacă expandăm această interogare după cum urmează: 
SELECT 
1 ([Measures].[ Unit Sales] ) + ON COLUMNS, 
{ 


( [Customers].[ All Customers].[USA] , [Product].[ All Products].[Food] ), 
( [Customers].[ All Customers].| USA] , [Product].[ All Products].[Drink] ), 
( [Customers].[ All Customers].[USA] , 
[Product].[ All Products].[Non-Consumable] ) 
} ON ROWS 
FROM Sales 
vom obţine un rezultat imbricat (vânzările din USA pentru categoriile Food, Drink si Non- 
Consumable). 
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191,940.00 


24,597.00 
Non-Consun| 50,236.00 


Putem de asemenea sá expandăm interogarea anterioară prin adăugarea unei noi tări, 
Canada: 
SELECT 
{ ( [Measures].[Unit Sales] ) + ON COLUMNS, 
i 


( [Customers].[ All Customers].| USA] , [Product].[ All Products].[ Food] ), 
( [Customers].[ All Customers].| USA] , [Product].[ All Products].[Drink] ), 
( [Customers].[ All Customers].[USA] , 
[Product].[ All Products].[Non-Consumable] ), 
( [Customers].[ All Customers].[Canada],[Product].[All Products]. Food] ), 
([Customers].[ All Customers].[Canada],[Product].[A1l Products].[ Drink] ), 
([Customers].| All Customers].[ Canada] , 
[Product].[ All Products].[Non-Consumable] ) 
} ON ROWS 
FROM Sales 
obținând astfel vânzările din Canada şi USA pentru categoriile Food, Drink şi Non-Consumable. 


191,940.00 
24,597.00 


În cazul în care de exemplu pentru Canada avem înregistrări vide, acest lucru nu înseamnă că a 
apărut o eroare, ci pur şi simplu faptul că nu sunt înregistrate vânzări pentru această tara. Serverul 
OLAP nu generează eroare în cazul în care încercăm să apelăm o înregistrare care nu există, ci 
returnează valoarea zero. 


Mai analitic în interogările imbricate 
Deşi identificarea informațiilor specifice în tupluri poate părea o muncă dificilă, ea se 
face natural în funcție de ceea ce doreşte utilizatorul. Acesta analizează datele şi selectează o 
valoare, de exemplu Drink pentru USA în 1998, pentru a o expanda; în funcţie de această selecţie, 
poate obţine toți copiii din grupul Drink şi poate expanda interogarea, care arată astfel: 
SELECT 
1 ([Measures].[Unit Sales] ) ! ON COLUMNS, 


( [Time].[1997],  [Customers].[All  Customers]. [USA] , [Product]. [All 
Products].[ Food] ), 
( [Time].[1997], [Customers].[All  Customers]. [USA] , [Product]. [All 
Products ].[Drink].|4lcoholic Beverages] ), 
( [Time].[1997], [Customers].[All Customers].[USA] ,  [Product].[All 
Products ].[Drink].| Beverages] ), 
( [Time].[1997], [Customers].[All Customers].[USA] ,  [Product].[All 
Products ].[Drink].[Dairy] ), 
( [Time].[1997], [Customers].[All Customers].[USA] , 
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[Product].[All Products].[Non-Consumable] ), 
([Time].[1997], [Customers].[All Customers].[Canada],[Product].[All Products].[Food] ), 
([Time].[1997], [Customers].[All Customers].[Canada],[Product].[All Products].[Drink] 
([Time].[1997], [Customers].[All Customers].[Canada] , 
[Product].[All Products].[Non-Consumable] ) 
} ON ROWS 
FROM Sales 


Canada 


Reguli pentru crearea tuplurilor in clauza SELECT 
Interogarea precedentă furnizează un rezultat în care pe o coloană sunt valori pentru 
vânzările aferente nivelului Product Family (Food, Drink, Non-Consumable) şi nivelului Product 
Departament (Alcoholic Beverages, Beverages, Dairy). Acest lucru poate fi confuz la prima 
vedere pentru utilizator şi poate ar fi tentant să facem următoarea modificare pentru specificarea 
tuplurilor: 
([Time].[1998], [Customers].[ All Customers].[USA], [Product].[ All Products].[ Drink], 
[Product].[ All Products].[Drink].[Alcoholic Beverages] ), 
([Time].[1998], [Customers].[ All Customers].[ USA], [Product].[ All Products].[ Drink], 
[Product].[ All Products].[Drink].[ Beverages] ), 
([Time].[1998], [Customers].[ All Customers].[ USA], [Product].[ All Products].[ Drink], 
[Product].[All Products].[Drink].[Dairy] ), 
însă modificarea va genera eroare din cel putin două motive: 
1) cand folosim tupluri multiple pe o axa (in acest caz ROWS), fiecare tuplu trebuie sa aiba 
acelaşi număr de dimensiuni si tuplurile trebuie să fie în aceeaşi ordine a dimensiunilor. 
Astfel, acum avem 3 tupluri care au dimensiunile Time, Customer şi Product. O parte 
dintre linii au 3 membri şi altele au 4 membri, ceea ce va genera o eroare MDX. 
Problema se poate rezolva adăugând o altă dimensiune Product restului de tupluri, dar 
eroarea va persista din cauza celui de-al doilea motiv; 
2) Un tuplu trebuie să fie alcătuit din membri din dimensiuni unice, în timp ce în interogare 
s-a încercat ca o singură dimensiune, Product, să apară de două ori. 


Atunci când formulăm o interogare MDX trebuie neapărat să avem in vedere ce este de 
fapt un tuplu: un tuplu este un punct în interiorul cubului unde se află valori ale măsurilor 
(faptelor). Prin includerea a doi membri din aceeaşi dimensiune, se definesc de fapt două valori 
diferite pentru un acelaşi punct din interiorul cubului, ceea ce evident nu este posibil. Astfel, când 
imbricăm interogările, se poate folosi doar o singură valoare asociată unei anumite dimensiuni. 
De asemenea, când definim tupluri într-o clauză SELECT, pentru fiecare axă, fiecare tuplu 
trebuie să aibă acelaşi număr de dimensiuni, în aceeaşi ordine. Cu excepţia dimensiunii Measures, 
dimensiunile dintr-un tuplu trebuie să fie unice. 
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Tot legat de imbricare, următoarea interogare nu va funcționa deoarece atunci cand dorim 
să avem mai mulți membri într-un tuplu, trebuie să precizăm valori specifice, nu niveluri generale 
ale dimensiunilor. 

SELECT 

1 ([Measures].[Unit Sales] ) } ON COLUMNS, 

([Customers].[ Country]. MEMBERS , [Product]. Product Family]. MEMBERS )} ON 
ROWS 
FROM Sales 


Clauza WHERE 
Clauza WHERE din MDX este diferită de cea din SQL. În MDX, clauza WHERE 
defineşte care dimensiuni sunt menținute constante şi la ce valoare sunt menținute. 
SELECT 
1 ([Measures].[Unit Sales] ) ! ON COLUMNS, 
! ( [Product].[ Product Category]. MEMBERS ) } ON ROWS 


FROM Sales 
WHERE ( [Customers].[All Customers].[USA].[WA], [Time].[1997] ) 
Unit Sales 

Beer and Wine 3,222.00 
Carbonated Beverages 1,626.00 
Drinks 1,071.00 
Hot Beverages 2,015.00 
Pure Juice Beverages 1,590.00 
Dairy 1,865.00 
Bread 3,707.00 
Baking Goods 3,968.00 
Jams and Jellies 5,668.00 
Breakfast Foods 1,517.00 
Canned Anchovies 419,00 
Canned Clams 376,00 
Canned Oysters 296.00 
Canned Sardines 370,00 
Canned Shrimp 400,00 
Canned Soup 3,748.00 


Clauza WHERE din exemplul anterior menține constantă dimensiunea Cusotmers la 
valoarea WA, iar dimensiunea Time la valoarea 1997. Valorile pentru măsura Unit Sales sunt 
extrase pentru toate categoriile de produse. 
Dacă se doreşte obținerea valorilor pentru variabilele Store Cost şi Store Sales pentru 
categoria Dairy în anul 1997 în țările unde s-au vândut produse, se poate apela la următoarea 
interogare MDX: 
SELECT 
{ ( [Measures].[Store Cost] ) , ([Measures].[Store Sales] ) } ON COLUMNS, 
{ ( [Store].[Store Country]. MEMBERS ) } ON ROWS 

FROM Sales 

WHERE ( [Product].[Drink].[Dairy] , [Time].[1997]) 


Store Cost | Store Sales 


2,830.92 $7,058.60 
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Liniile vide din rezultatul interogării semnifică faptul că nu sunt înregistrări in depozitul 
de date pentru țările Canada si Mexico în perioada precizată. 
Interogările pot să devină din ce în ce mai analitice; astfel, dacă vrem să creştem gradul 
de detaliere, putem folosi interogarea următoare: 
SELECT 
1 ([Measures].| Store Cost] ) , ([Measures].[Store Sales] ) } ON COLUMNS, 
{ ([Store].[ Store Country]. MEMBERS ) } ON ROWS 
FROM Sales 
WHERE ( [Product].[Drink].[Dairy].[Dairy].[Milk] , [Time].[1997]) 


Erori in clauza WHERE 
Dacă ţinem cont de faptul că valorile din clauza WHERE „blochează” de fapt o 
dimensiune la o valoare constantă, nu ar trebui să avem probleme cu interogările. 
De exemplu, următoarea interogare nu va funcționa: 
SELECT 
{ ([Measures].| Store Cost] ) , ( [Measures].[ Store Sales] ) | ON COLUMNS, 
{ ([Store].[ Store Country]. MEMBERS ) } ON ROWS 
FROM Sales 
WHERE ([Product].[Drink].[Dairy ].[Dairy].[Milk] , [Time].[1998], [Time].[1997] ) 
deoarece dimensiunea Time nu poate fi „blocată” simultan pe valorile 1997 si 1998. Elementele 
dintr-o clauză WHERE formează un tuplu, iar un tuplu se defineşte pe baza mai multor 
dimensiuni. Interogarea de mai jos de asemenea nu va funcționa: 
SELECT 
{ ([Measures].[ Store Cost]), (| Measures].[ Store Sales] ) | ON COLUMNS, 
{ ( [Product].[ Product Family]. MEMBERS ) | ON ROWS 
FROM Sales 
WHERE ( [Product].[Drink].[Dairy].[Dairy].[Milk] , [Time].[1998] ) 
pentru că dimensiunea Product apare atât în secţiunea SELECT cât şi în secţiunea WHERE a 
interogării. Secţiunea SELECT cere interogarea mai multor valori pentru Product Family, în timp 
ce clauza WHERE „blochează” dimensiunea pe valoarea Milk; acest lucru nu este posibil 
simultan. Astfel, ca regulă generală, dimensiunile care apar în clauza WHERE nu trebuie să apară 
şi în clauza SELECT. 


Plasarea măsurilor în clauza WHERE 

O interogare interesantă şi care returnează rezultat este următoarea: 

SELECT 

{ ([Time].[1998]), ([Time].[1997] ) } ON COLUMNS, 
{ ([Store].[ Store Country]. MEMBERS ) } ON ROWS 

FROM Sales 

WHERE ([Product].[Drink].[Dairy].[Dairy].[Milk] ) 

Interogarea este interesantă deoarece în clauza SELECT nu am precizat nici o măsură 
despre care dorim să aflăm valori. În acest caz, serverul OLAP consideră implicit măsura Unit 
Sales, care este prima măsură în dimensiunea Measures. Pentru a obţine de exemplu valoarea 
măsurii Store Sales pentru anul 1997 pentru toate ţările, trebuie să rescriem interogarea în felul 
următor: 

SELECT 

1 ([Time].[1997] ) } ON COLUMNS, 
( [Store].[Store Country]. MEMBERS) ON ROWS 
FROM Sales 
WHERE ([Product].[Drink].[Dairy].[Dairy].[Milk] , [Measures].[Store Sales] ) 
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Canada 


Mexico 


